在dataframe中如何对某列的值进行分割或者提取 您所在的位置:网站首页 python dataframe提取某列 在dataframe中如何对某列的值进行分割或者提取

在dataframe中如何对某列的值进行分割或者提取

2023-08-21 04:11| 来源: 网络整理| 查看: 265

#本方法主要是无法使用split的情况,即文本中没有明显分隔符。 在数据预处理的时候,会将单条数据特征组合成为文本放入某列中。一般情况下,会有分割符将其分割开,推荐使用split方法 #但是也可能会出现类似下面的文本,没有明显分割符。此时需要考虑str[\d:\d]的格式对文本进行裁剪,获取新列。 在这里插入图片描述 这里,我希望把年份提取出来作为新列。那么就是variable列的[3:7]部分。

#我先尝试了NTL_reject['year'] = NTL_reject['variable'][3:7],发现并不能提取出我需要的东西,正确语句应当如下: NTL_reject['year'] = NTL_reject['variable'].apply(lambda x:x[3:7]) NTL_reject.head()

在这里插入图片描述 得到year列 ##这里讲以下简单原理 主要是针对Series的apply函数应用。 Series就是Dataframe的组成单元。df[col]提取出来的就是Series格式。【我是这样理解的,如果有错误请在评论区指出~】 而apply()中引用的函数会依次应用到该列的每一个元素,产生新列。apply()经常和lambda合并使用



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有